home *** CD-ROM | disk | FTP | other *** search
/ NetNews Offline 2 / NetNews Offline Volume 2.iso / news / comp / lang / c++-part2 / 13438 < prev    next >
Encoding:
Internet Message Format  |  1996-08-05  |  1.2 KB

  1. Path: sdcc12.ucsd.edu!helix!mike
  2. From: mike@helix.ucsd.edu (Mike Lindelsee)
  3. Newsgroups: comp.databases,comp.databases.theory,comp.lang.c,comp.lang.c++
  4. Subject: matching strings and their plurals
  5. Date: 25 Mar 1996 19:15:34 GMT
  6. Organization: University of California, San Diego
  7. Message-ID: <4j6rcm$ms0@sdcc12.ucsd.edu>
  8. NNTP-Posting-Host: helix.ucsd.edu
  9.  
  10. Hi,
  11.  
  12. I'm doing some work where I'm trying to get strings and their plurals out
  13. of a database.  Hopefully, searching on either will pull both out.  The need
  14. here is that I won't know ahead of time if the database will have the plural
  15. or singular version (or both) and want to make sure I find whatever is there.
  16. Does anyone have any pointers for algorithms, heurisitics, or code to get me
  17. started?
  18.  
  19. I'm thinking about using some kind of stemming algorithm and storing the 
  20. keys in the database as just the stems of the words and searching on just the
  21. stem of whatever is being looked for.  This sounds like something that 
  22. someone has probably done before (and why reinvent the wheel).
  23.  
  24. I'd appreciate it if responses could be emailed to me - I'll follow up with
  25. a summary if anyone expresses interest.
  26.  
  27. Thanks for the assist!
  28.  
  29. Mike
  30.